导入 结巴

文本 = 打开("threekingdoms.txt", "r", 编码方式="utf-8").读取()
排除词集合 = {"将军", "却说", "荆州", "二人", "不可", "不能", "如此"}
词表 = 结巴.分词列表(文本)
次数字典 = {}

取 词 于 词表:
	如果 长(词) == 1:
		过
	或如 词 == "诸葛亮" 或 词 == "孔明曰":
		校正词 = "孔明"
	或如 词 == "关公" 或 词 == "云长":
		校正词 = "关羽"
	或如 词 == "玄德" 或 词 == "玄德曰":
		校正词 = "刘备"
	或如 词 == "孟德" 或 词 == "丞相":
		校正词 = "曹操"
	否则:
		校正词 = 词
	次数字典[校正词] = 次数字典.获取(校正词, 0) + 1 

取 词 于 排除词集合:
	删 次数字典[词]
    
词次数表 = 列表型(次数字典.项々())
词次数表.排序(键=雷锋 x: x[1], 逆=真) 

取 i 于 范围(10):
	词, 次数 = 词次数表[i]
	打印("{0:<10}{1:>5}".格式化(词, 次数))
    